Human Approval Boundary
Human Approval Boundary
Definition
Human Approval Boundary는 에이전트가 계획·초안·검증·준비 작업은 자동으로 수행하되, 외부 효과가 있거나 되돌리기 어려운 행동은 사람의 명시 승인을 거치게 하는 제품/운영 경계다.
Why It Matters
좋은 업무 에이전트는 모든 것을 자동화하는 시스템이 아니라, 위험도가 낮은 작업은 밀어붙이고 위험도가 높은 작업은 적절히 멈춰 사람에게 넘기는 시스템이다.
Related Concepts
- [Agent Harness](/notes/30-concepts__Agent Harness/)
- [Ephemeral Agent Sandbox](/notes/30-concepts__Ephemeral Agent Sandbox/)
- [Agent Skill](/notes/30-concepts__Agent Skill/)
Source-Backed Claims
- Agents SDK 데모에서는 task 상태를
done으로 바꾸는 행동에 approval을 요구해, 중요한 상태 변경을 사람 승인 지점으로 둘 수 있음을 보여준다. Source: [OpenAI Build Hour - Agents SDK](/notes/10-sources__OpenAI Build Hour - Agents SDK/) - 견적 발행, 고객 메일 발송, 배포, 결제, 세금계산서 같은 외부 효과 작업은 에이전트가 준비하되 최종 권한은 사람이 가져야 한다는 운영 설계가 필요하다. Source: [OpenAI Build Hour - Agents SDK](/notes/10-sources__OpenAI Build Hour - Agents SDK/)
Examples
- 에이전트가 고객 메일 초안을 작성하고 첨부파일을 준비하지만, 실제 발송 전 승인 버튼을 요구한다.
- 에이전트가 배포 계획과 diff를 생성하지만, production deploy는 사람 승인을 요구한다.
Open Questions
- 승인 단계가 너무 많아 자동화 효율을 떨어뜨리지 않으면서도 사고를 막는 기준은 무엇인가?
Sources
- [OpenAI Build Hour - Agents SDK](/notes/10-sources__OpenAI Build Hour - Agents SDK/)